查看原文
其他

专题培训|文澜金融2020金融科技工具箱专题培训: Python与金融数据分析


文澜金融2020金融科技工具箱专题培训

Python 与 金融数据分析


01

课程介绍


本次培训采用理论与案例相结合的方式,旨在帮助零基础学员轻松入门Python,由浅入深学习和掌握Python的编程技术,特别是爬虫技术和文本分析技术。


本课程共四天。第一天是Python编程入门,带领学员迅速了解Python的原生语法规则、Jupyter编程环境与代码规范,使得学员能使用Python编写和执行最基本的程序;第二天将介绍简单的Python爬虫技术,深入了解HTTP协议、HTML语言、BeautifulSoup和Requests等Python第三方库的运用;第三天将学习基于路径表达式xpath的爬虫技术和基于selenium模拟登陆的爬虫案例以及爬虫数据处理。


02

课程时间、地点


1.时间

6月15日(周一)至18日(周四)

上午9:00-11:30

下午14:30-17:00


2.地点

腾讯会议


03

授课对象


金融学院全体教师、研究生和“优本计划”班


04

爬虫俱乐部简介


爬虫俱乐部由中南财经政法大学李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队,已针对教师和研究生多次举办Stata和Python的编程课程,曾经在厦门大学、武汉大学、华中科技大学、中央财经大学、华中农业大学、西南财经大学、西南政法大学、郑州大学、河南大学、福州大学、长沙理工大学、广西大学、石河子大学、新疆财经大学、郑州大学和湖北大学等多所高校进行培训,反应良好。


05

主讲人简介


1.薛原

香港岭南大学研究助理,爬虫俱乐部高级成员,擅长Stata编程、正则表达式、字符串处理及Python网络爬虫技术。与李老师合作开发了chinagcode、chinaaddress、cnintraday、cnstock、subinfile、reg2docx、sum2docx、wordconvert等重要命令,实现了中文地址与经纬度之间的转换,中国上市公司股票代码和分时交易数据的获取以及修改文本文件,在《金融研究》发表过文章。


2.张计宝

香港理工大学研究助理,爬虫俱乐部高级成员,擅长Stata及Python编程、正则表达式、数据处理、文本分析技术及网络爬虫技术。在《财政研究》等期刊发表学术论文数篇。


3.张学人

武汉大学研究助理,爬虫俱乐部高级成员,擅长Stata、Python编程,字符串处理及网络爬虫技术,与李春涛教授合作开发cntraveltime、cnmapsearch等命令,拥有丰富的Python编程及项目经验。


06

培训大纲


6月15日 周一

第一天 认识Python、熟悉Python的基础知识


导论

    Python的简介、应用前景

    Python在数据处理与爬虫上的优势

    Python环境安装与脚本运行

    Jupyter编程环境简介

    第一个Python程序

    我们应当如何高效地学习Python爬虫

    基础入门

    常用数据类型

        ①数值型变量

        ②字符串变量

        ③布尔型变量

    运算符

    三种流程控制结构

        ①for

        ②while

        ③if

        基础升级

    常用数据类型

        ①列表

        ②字典

    函数及方法

6月16日 周二

第二天  Python爬虫基础


课前知识

    pandas简介与基础

    第三方库json介绍

    爬虫案例

    爬虫初步:抓取爬虫俱乐部官网推文(get方式)

    爬虫伪装:抓取深交所信息披露考评信息

    post型请求页面:抓取和讯网基金经理人信息

    抓取基金从业人员资格信息公示网站

    配套知识/工具

    requests第三方库

    服务器请求原理与爬虫的本质工作

    HTML文档树概念

    网页信息解析库:BeautifulSoup

 6月17日 周三

第三天  Python爬虫技术


XPath

    路径表达式

        ①使用XPath确定元素

        ②获取文本内容与文本节点

        ③获取属性

    XPath运算符

    使用XPath提取网页信息

        ①爬取新浪财经上市公司高管任职信息

        ②爬取新浪财经上市公司公告信息

        selenium模拟登录

    当前业界反爬措施的总介绍

    selenium爬虫的代码理念与爬虫的工程控制

    使用selenium抓取深交所信息披露考评数据

    使用selenium爬取企查查数据 

6月18日 周四

第四天  Python与文本分析


文本分析基础内容

    分词原理

    分词实现

    高频词统计

    图形可视化

    案例分析

    日料店评论的情感分析

    基于TFIDF进行语调分析

    上市公司公告的主题模型分析

💁

扫描下方二维码报名吧~

温 馨 提 示:

由于服务器承载能力有限,故只能按照报名的先后顺序接受100人报名,请各位有意学习的师生速速报名哦。我们将在您报名成功后,逐一与您联络接入课程的细节事宜。


END



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存